Furigana是日语写作中使用的发音笔记。能够检测到这些可以帮助提高光学特征识别(OCR)性能,或通过正确显示Furigana来制作日本书面媒体的更准确的数字副本。该项目的重点是在日本书籍和漫画中检测Furigana。尽管已经研究了日本文本的检测,但目前尚无提议检测Furigana的方法。我们构建了一个包含日本书面媒体和Furigana注释的新数据集。我们建议对此类数据的评估度量,该度量与对象检测中使用的评估协议类似,除非它允许对象组通过一个注释标记。我们提出了一种基于数学形态和连接组件分析的Furigana检测方法。我们评估数据集的检测,并比较文本提取的不同方法。我们还分别评估了不同类型的图像,例如书籍和漫画,并讨论每种图像的挑战。所提出的方法在数据集上达到76 \%的F1得分。该方法在常规书籍上表现良好,但在漫画和不规则格式的书籍上的表现较少。最后,我们证明所提出的方法可以在漫画109数据集上提高OCR的性能5 \%。源代码可通过\ texttt {\ url {https://github.com/nikolajkb/furiganadetection}}}
translated by 谷歌翻译
我们描述了与全球结构搜索方法结合使用的局部替代模型。该模型遵循高斯近似电势(GAP)形式主义,并基于原子位置描述符的平滑重叠,而使用Mini Batch $ K $ -MEANS则减少了本地环境的稀疏性。该模型是在原子全局优化X框架中实现的,并用作盆地跳结构搜索中局部放松的部分替代。该方法对于多种原子系统(包括分子,纳米颗粒,表面支撑的簇和表面薄膜)来说是可靠的。展示了本地替代模型的结构搜索环境中的好处。这包括从较小的系统转移学习的能力,以及执行并发多层计量搜索的可能性。
translated by 谷歌翻译
为了支持行业4.0触觉和人机互动的应用,第六代(6G)需要一个完全自主,视觉和互动的新框架。在本文中,我们为专用网络计划服务提供了一个新颖的框架,提供了一种端到端解决方案,该解决方案从用户设备接收视觉和感官数据,重建3D网络环境并在服务器上执行网络计划,并可视化在用户设备显示上,具有增强现实(AR)的网络性能。该解决方案由三个关键的技术组件授权:1)基于视觉和传感器融合的3D环境重建,2)基于射线跟踪的无线电图生成和网络计划,以及3)实时摄像机启用AR-Empower的网络可视化重新定位。我们在德国的博世植物中进行了概念验证,并显示了优化天线位置的良好网络覆盖范围,并且在环境重建和摄像机重新定位中均高精度。我们还实现了实时AR支持的网络监视,每帧的端到端延迟约为32毫秒。
translated by 谷歌翻译
我们提供了一种主动识别分布的小小的变化的方法,从而导致模型性能差异很大。为了确保这些转移是合理的,我们会以观察到的变量的因果机制的可解释变化来对其进行参数化。这定义了合理分布的参数鲁棒性集和相应的最坏情况损失。虽然可以通过重新加权技术(例如重要性抽样)来估算单个参数转移下的损失,但最终的最坏情况优化问题是非convex,并且估计值可能遭受较大的差异。但是,对于小移位,我们可以构建局部二阶近似值,以构建损失的损失,并提出找到最坏情况下的最差偏移作为特定的非凸二次二次优化问题,为此有效算法可用。我们证明,可以直接估计条件指数族模型中的移位,并且绑定了近似误差。我们将方法应用于计算机视觉任务(从图像中对性别进行分类),从而揭示了对非毒物属性转变的敏感性。
translated by 谷歌翻译
最近,已经提出了利用预测模型在不断变化的环境方面的不变性来推断响应变量的因果父母的子集的不变性。如果环境仅影响少数基本机制,则例如不变因果预测(ICP)确定的子集可能很小,甚至是空的。我们介绍了最小不变性的概念,并提出了不变的血统搜索(IAS)。在其人群版本中,IAS输出了一个仅包含响应祖先的集合,并且是ICP输出的超集。当应用于数据时,如果不变性的基础测试具有渐近水平和功率,则相应的保证会渐近。我们开发可扩展算法并在模拟和真实数据上执行实验。
translated by 谷歌翻译
置信区间是用于分析数据的标准技术。当应用于时间序列时,单独计算每个时间点的置信区间。或者,我们可以计算信心乐队,在那里我们需要找到封装$ k $时间序列的最小区域,其中$ k $是用户参数。然后可以使用置信带来检测异常时间序列,而不仅仅是时间序列内的个人观察。我们将表明,尽管是一个NP难题,但有可能找到最佳的信心乐队,以便为某个$ k $。我们通过考虑一个不同的问题来实现这一目标:发现正则频段,在那里我们最小化信封区域减去参数$ \ alpha $加权的包含时间序列的数量。与正常的置信带不同,我们可以通过使用最小切割来解决问题。通过不同$ \ Alpha $我们可以获得各种$ k $的解决方案。如果我们有一个约束$ k $,我们找不到适当的$ \ alpha $,我们演示了一种简单的算法,通过将问题连接到最小$ k-hyion来产生$ o(\ sqrt {n})$近似保证问题。这种连接也意味着我们不能比$ O(低{1/4})$以下的问题近似问题。最后,我们考虑一个变体,而不是最小化我们最小化最大宽度的区域。在这里,我们展示了一个简单的2近似算法,并表明我们无法达到更好的近似保证。
translated by 谷歌翻译
测量分类器的性能是机器学习中的一个重要任务。计算测量的算法的运行时间在离线设置中播放非常小的作用,例如,当研究员正在开发分类器时,在离线设置中起着非常小的作用。然而,如果我们的目标是监视分类器随时间的性能,则运行时间变得更加重要。在本文中,我们研究了三种算法以维持两种措施。第一个算法在ROC曲线(AUC)下维护区域,并在$ O(\ log n)$ time中的数据点删除。这是通过维护在自平衡搜索树中排序的数据点来完成的。此外,我们增强了搜索树,允许我们在$ O(\ log n)$ time中查询数据点的ROC坐标。这样做,我们能够维护$ O(\ log n)$ time。我们的接下来的两种算法涉及维持$ H $ -MEASURE,这是基于ROC曲线的替代度量。计算该度量是两步处理:首先,我们需要计算ROC曲线的凸壳,然后在凸船上的总和。我们证明我们可以使用经典凸船体维护算法的次要修改来维护凸船体。然后,我们显示在某些条件下,我们可以在$ o(\ log ^ 2 n)$ time中,计算$ h $ -measure,如果没有满足条件,那么我们可以估计$ h $ -measure $ o((\ log n + \ epsilon ^ { - 1})\ log n)$ time。我们凭经验展示了我们的方法明显比基线更快。
translated by 谷歌翻译
上下文的强盗和强化学习算法已成功用于各种交互式学习系统,例如在线广告,推荐系统和动态定价。但是,在高风险应用领域(例如医疗保健)中,它们尚未被广泛采用。原因之一可能是现有方法假定基本机制是静态的,因为它们不会在不同的环境上改变。但是,在许多现实世界中,这些机制可能会跨环境变化,这可能使静态环境假设无效。在本文中,考虑到离线上下文匪徒的框架,我们迈出了解决环境转变问题的一步。我们认为环境转移问题通过因果关系的角度,并提出了多种环境的背景匪徒,从而可以改变基本机制。我们采用因果关系文献的不变性概念,并介绍了政策不变性的概念。我们认为,仅当存在未观察到的变量时,政策不变性才有意义,并表明在这种情况下,保证在适当假设下跨环境概括最佳不变政策。我们的结果建立了因果关系,不变性和上下文土匪之间的具体联系。
translated by 谷歌翻译